\begin{center}
	\includegraphics[width=0.2\textwidth]{content/chapter-15/images/1}
\end{center}

过去的几十年里，图形处理单元(GPU)已经从在屏幕上绘制图像的硬件设备，发展到能够执行复杂并行内核的通用设备。现在，几乎每台计算机都有一个GPU和一个CPU，许多程序可以通过将部分并行算法从CPU转移到GPU来加速。\par

本章中，我们将描述GPU是如何工作的，GPU软件和硬件是如何执行SYCL应用程序的，以及当我们为GPU编写和优化并行内核时需要的技巧和技术。\par























































